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PROCEDE DE SYMCHRONISATION DE DEUX FLUX DE DOMMEES 
MURflERIQUES DE MEME CONTENU. 
L'invention concerne un procede de synchronisation de deux 
flux de donnees numeriques de mSnne contenu, et en particulier d*un flux de 
5 reference correspondant par exemple a une emission par un systeme de 
teletransmission, et d'un flux re9u avec d'eventuelles degradations, utilisable 
notamment en vue d'une evaluation de la qualite de la transmission. 

Dans le domaine de la diffusion de signaux audiovisuels, 
rintroduction du numerique offre de nouvelles perspectives et permet de 
10 proposer un plus grand nombre de services aux utilisateurs. 

Lors des differentes etapes necessalres a la diffusion, les 
signaux sont modifies. En effet, les oontraintes techniques imposdes, en 
termes de debit ou de largeur de bands par exemple, impliquent Tapparition 
de degradations caracteristiques lors de conditions de transmission difficiles. 
15 Pour pouvoir assurer une quality de service, ii est n^cessaire 

de developper des outils et instruments qui permettent de mesurer la quality 
des signaux et d'estimer Timportance des degradations introduites le cas 
echeant De nombreux proc6d6s de mesure ont ete developp6s dans ce but. 
La majorite de ceux-ci se base sur une comparaison du signal (nomme signal 
20 de reference) present a I'entree du systeme a etudier, avec le signal (nomme 
signal degrade) obtenu a la sortie du systeme. Certaines methodes dites a 
"reference reduite" utilisent une comparaison entre des nombres calcules sur 
la reference et sur le signal degrade au lieu d'utiliser directement les 
echantillons du signal. Dans les deux cas, il est necessaire de synchroniser 
25 temporellement les signaux pour effectuer revaluation de qualite par 
comparaison. La Figure 1 illustre le principe general utilise par ces methodes. 

Si la synchronisation des signaux peut etre facilement realis§e 
en simulation ou lorsque le systeme a etudier est reduit (cas d'un codeur- 
d^codeur ou "codec" par exemple) et non distribue geographiquement, cela 
30 est tr§s different dans le cas d'un systeme complexe, notamment dans le cas 
de la supervision d'un reseau de diffusion. Ainsi, cette etape de 
synchronisation est souvent une 6tape critique des algorithmes de 
qualitometrie, 

Au dela des applications de mesure de la qualite dans un 
35 r6seau de diffusion, le procede presente dans ce rapport est applicable a 
chaque fois qu'une synchronisation temporelle entre deux signaux audio et/ou 
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vid6o dolt ^tre effectu^e. en particulier dans le contexte d'un systdme r§parti 
et etendu. 

DIverses techniques peuvent §tre utilis^es pour synchroniser 
temporellement des signaux nunneriques. L'objectif est de mettre en 
5 correspondance una partie du signal degrade So. avec une partie du signal de 
r6f6rence Sr. La Figure 2 illustre cette probl6matique dans le cas de deux 
signaux audio. II s'agit de determiner un d6calage DEC pemiettant de 
synchroniser les signaux. 

Dans le cas d'un signal audio, la partie (ou element) a mettre 
10 en correspondance. est une fen^tre temporelle, c'est a dire une dur^e 
arbitraire T du signal. 

On peut repartir les methodes existantes en trois classes : 
o Approche par correlation dans le domaine tempore I : 
C'est I'approche la plus courante. Eile consiste ^ comparer !es echantillons 
15 des deux signaux audio Sr et So a synchroniser, en se basant sur leur 
contenu. Ainsi, I'utilisation de la fonction d'intercon-elation normalisee par 
exemple, entre Sr et So. permet de rechercher le maximum de ressemblance 
sur une plage temporelle donn(§e T, par exemple de plus ou moins 60 ms, soit 
120 ms. La precision de synchronisation obtenue est potentiellement S 
20 rechantillon pr§s. 

o Approche par correlation dans le domaine temporel 
utilisant des signaux marqueurs : les methodes qui utilisent ce principe visent 
a palller la necessity de variations significatives dans le signal. Pour cela, un 
signal marqueur sp§cifique est insere dans le signal audio Sr. Ce signal est 
25 congu pour permettre une synchronisation robuste. Ainsi. une procedure 
d'lntercorr^lation identique a la pr^cedente peut etre appliqu6e entre les 
signaux marqueurs extraits des signaux Sr et So a synchroniser, ce qui 
permet en principe une synchronisation robuste quel que soit le contenu du 
signal audio. 

30 Afin d'etre applicable, I'operation d'insertion du signal 

marqueur doit etre telle que le contenu du signal audio soit modifie de la fagon 
la moins perceptible possible. Plusieurs techniques sont utilisables, dont le 
"watermarking", pour Insurer ces signaux marqueurs ou motifs sp6cifiques. 

o Synchronisation par des reperes temporels : Les 

35 methodes de cette classe ne sont utilisables que dans le cas oCi les signaux 
sont associ^s d des reperes temporels. Ainsi, le processus repose sur la 
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recherche, pour chaque repdre du signal de reference, celui qui est le plus 
proche dans la suite des rep^res temporels associee au signal degrade. 

Un precede de synchronisation de signaux performant se 
caracterise par un compromis entre : 
5 - SB precision, c'est a dire I'erreur maximaie comnnise en 

synchronisant les deux signaux. En particulier, le precede peut §tre sensible 
au contenu des signaux , 

sa complexity de calcul, 
- et enfin le volume de donnees n§cessaires pour effectuer 

10 la synchronisation. 

Le principal inconvenient des techniques les plus 
classiquement utilisees (rapproche par congelation mentionn6e ci-dessus) est 
la puissance de calcul n6cessalre. En effet, celle-ci devlent en effet tr6s 
importante d^ que la plage de recherche T augmente (Figure 2). De plus, 

15 I'autre Inconvenient majeur est la n§cessit§ d'un contenu ^voluant de manidre 
significative en permanence. Suivant le type de signaux analyses, cette 
hypothdse n'est pas toujours vraie. Le contenu des signaux a done une 
influence directe sur la perfomnance de la methode. Par allleurs, pour utiliser 
ce type d'approche sur les signaux temporels complets, 11 est n^cessaire de 

20 disposer des deux signaux Sr et So au point de comparaison : c'est une 
contrainte tr6s forte, qu'il n'est pas possible de satisfaire pour certaines 
applications comma la surveillance d'un reseau de diffusion operationnei. 

La seconde approche (correlation avec signaux marqueurs) a 
pour caracteristique de modifier le contenu du signal audio afin d'y inserer des 

25 signaux marqueurs, sans garantie de I'impact de cette operation sur la 
qualite : le precede de mesure influe done sur la mesure e!le-m§me. Quelle 
que soit la performance pour la synchronisation de deux signaux, cette 
approche ne convient pas toujours a une application r^elle d'evaluation de la 
quality. 

30 Enfin, dans le cas d'une synchronisation par des reperes 

temporels, c'est la necessity de disposer des reperes temporels qui est 
I'inconvenient majeur. Seules quelques applications peuvent utiliser une telle 
technique. En effet, la precision des reperes temporels n'est pas toujours 
satisfaisante. 

35 Dans le cadre de la surveillance d'un reseau de diffusion et en 

raison des contraintes multiples subies par les signaux transportes, et des 
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multiples equipements traverses (codeurs, multiplexeurs, trans-multiplexeurs, 
decodeurs, il nV a pas de relation tres stricte entre les signaux audio et 
les reperes temporels. Cette solution n'atteint alors pas la precision 
necessaire pour une application de mesure de la qualite avec reference. 
5 La presente invention a pour but de definir un precede 

permettant de realiser une synchronisation, d'un niveau de precision qui peut 
etre choisi, d*une complexite plus faible que les methodes existantes, en 
combinant les avantages de plusieurs approches. Une synchronisation 
« grossiere » delimite selon ('invention une plage d'erreur, dont la duree est 

10 compatible avec Tutilisation ulterieure de methodes classiques de 
synchronisation « fine » si une precision extreme est requise. 

L'originalite de la methode proposee est de realiser une 
synchronisation a partir d'au moins un param6tre caracteristique, calcule sur 
les signaux So et Sr, definissant une trajectoire multidimensionnelle. pour en 

15 d^duire une synchronisation des signaux eux-memes. La methode faisant 
appel au contenu des signaux, ce contenu tempore! doit varier en 
permanence pour assurer une synchronisation optimale, de m§me que la 
correlation temporelle de T^tat de Tart anterieur. Ua vantage du precede est de 
faire une correlation grace une trajectoire multidimensionnelle, obtenue 

20 notamment en combinant plusieurs parametres caracteristiques, qui permet 
d'obtenir une fiabilite superieure a celle des precedes connus. 

Un avantage fondamental du precede propose par invention 
est de ne necessiter que peu de donnees pour realiser une synchronisation, 
ce qui est tres utile dans le cadre de la supervision d*un reseau de diffusion. 

25 En effet, dans ce contexte, il n'est generalement pas possible d'avoir les deux 
signaux complets Sr et So au meme endroit. Par consequent, il n'est pas 
possible d'utfllser une approche par correlation temporelle classlque. De plus, 
dans le cadre d'une application de qualitometrie, la seconds approche par 
correlation avec signaux marqueurs n'est pas facilement applicable car elle 

30 agit sur la qualite des signaux. Au contraire. le proced6 de synchronisation 
selon invention est compatible avec des techniques de qualitometrie 
reposant sur la comparaison de paramdtres calcules sur les signaux. Les 
donnees representatives de ce ou ces parametres caracteristiques sent 
facilement transportables par une liaison numerique jusqu'aux points de 

35 comparaison. Cette liaison num6rique utilise avantageusement le meme canal 
de transmission que le signal audio ; alternativement. une liaison numerique 
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dedi6e peut etre choisie. Dans un mode particulier de realisation pour une 
application de mesure de la qualite, les^ donnees utilisees pour realiser la 
synchronisation sont ainsi issues d'un ou plusieurs parametres de mesure de 
la qualite. Par ailleurs, une synchronisation dite grossiere est realisee a partir 
5 de donnees D1 et D2 calculees a intervalles de A = 1024 echantillons audio. 
Une synchronisation fine peut etre realisee avec des donnees D1 calculees a 
intervalles de A = 1024 echantillons audio, et avec des donnees D2 calculees 
a intervalles de r < A, par exemple r = 32 echantillons audio. Ainsi, le precede 
permet dans ce cas de realiser une synchronisation fine 32 fois plus precise 
10 que rintervalle de transmission des parametres de mesure de la qualite. 

Le procede s'integre ainsi naturellement dans un systeme de 
surveillance de la qualite en television numerique sur un reseau de diffusion 
operationnel- Mais il est applicable a chaque fois qu'une synchronisation 
temporelle entre deux signaux doit §tre effectuee. 
15 Le proc6de propose permet ainsi de realiser la \ 

synchronisation avec une pr§cision que Ton peut choislr et ainsi obtenir une 
plage d'incertitude trds r^duite, Avantageusement, il utilisera au moins en 
partie des parametres dejd calculus pour etudier la quality du signal. Le fait de u 
pouvoir partir d'une plage de recherche etendue est egalement un atout, 
20 d'autant plus que la robustesse de la synchronisation augmente avec la 
largeur de cette plage de depart. 

Le procede propose n'impose done pas d'avoir de reperes 
temporels externes aux signaux audio. Le signal a synchroniser n*a pas 
besoin non plus d'etre modlfie, ce qui est une condition importante dans une 
25 application de mesure de la qualite. 

Uinvention concerne ainsi un procede de synchronisation 
entre deux flux de donnees numeriques de mdme contenu caracterise en ce 
qu1l met en oeuvre : 

a) pour chacun des deux flux de donnees num6riques Si et 
30 Sz, generer ^ des inten/alles donnes d'au moins deux nombres 

caracteristlques exprimant au moins un parametre caract6ristique de leur 
contenu ; 

b) pour chacun des deux flux Si et Sa, generer a partir desdits 
nombres de points Di et Dg associes respectivement ^ chacun desdits flux et 

35 representant au moins un dit parametre caracteristique dans un espace a au 
moins deux dimensions, les points Di d'une part et D2 d'autre part, qui 
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appartiennent a une plage temporelle T, definissant des trajectoires 
representatives des flux de donnees Si et S2 a synchroniser ; 

c) decaler Tune par rapport a Tautre les plages temporelles de 
dur6e T affectees aux flux de donnees nunneriques Si et S2 en calculant un 

5 critdre de superposition desdites trajectoires dont une valeur optimale 
represente la synchronisation recherchee ; 

d) choisir comme valeur representative de la synchronisation, 
le decalage entre les plages temporelles correspondant a ladite valeur 
optimale. 

10 Avantageusement, le precede est caracteris6 en ce qu'un des 

flux de donnees numeriques est un flux de reference Si et en ce que I'autre 
flux de donnees est un flux S2 regu a travers un systeme de transmission et en 
ce que les nombres caracteristiques de flux de reference Si sent transmis 
avec celui-ci, alors que les nombres caracteristiques du flux re9u S2 sont 
15 calcules a la reception. 

Selon une premiere variante, le precede est caracterise en ce 
que c) met en oeuvre : 

c1) caiculer une distance D entre d'une part une premiere 
trajectoire representee par les points D^ appartenant a une premiere plage 
20 temporelle de dur6e T. et d'autre part, une deuxieme trajectoire representee 
par les points D2 appartenant a une deuxieme plage temporelle de duree T, 
ladite distance D constituant ledit critere de superposition ; 

c2) decaler I'un par rapport a I'autre lesdites premiere et 
deuxieme plages temporelles de duree T jusqu'S obtention d'un minimum de 
25 la distance D qui constitue ladite valeur optimale ; 

La distance D peut §tre une moyenne arithmetique des 
distances d, par exemple des distances euclidiennes, entre les points 
correspondants Di, D2 des deux trajectoires. 

Selon une deuxieme variante. le precede est caracterise en 
30 ce que c) met en oeuvre : 

c1) caiculer une fonction de correlation entre les points 
correspondants (Di, D2) des deux trajectoires, ladite fonction de correlation 
constituant ledit critere de superposition ; 

c2) decaler I'un par rapport a I'autre lesdites premiere et 
35 deuxieme plages temporelles de duree T jusqu'a obtention d'un minimum de 
la fonction de correlation qui constitue ladite valeur optimale. 
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Selon une troisieme variante, le procede est caracterise en ce 
que c) met en ceuvre : 

c1) transformer chaque trajectoire en une suite d'angles entre 
des segments successifs definis par les points de la trajectoire, 
5 c2) decaler I'un par rapport a Tautre lesdites premiere et 

deuxieme plages temporelles de duree T jusqu'a obtenir un minimum entre les 
differences entre les valeurs d'angles obtenues pour des segments 
homologues des deux trajectoires, ledit minimum constituant ladite valeur 
optimale. 

10 Le procede peut etre caracterise en ce que c) met en oeuvre : 

c1) transformer les deux trajectoires en une suite de surfaces 
interceptees par les segments successifs dSfinis par les points desdites 
trajectoires, la surface totale interceptee constituant ledit critere de 
superposition. 

IS c2} decaler Tun par rapport d Tautre les plages temporelles de 

duree T jusqu'^ obtenir un minimum de ladite surface totale interceptee. qui 
constitue ladite valeur optimale. 

Un dit intervalle donne peut §tre egai a A pour un des deux 
flux de donnees et a r < A pour I'autre flux de donnees et ce afin d'ameliorer 
20 la precision de la synchronisation. 

Le procede peut etre caracterise en ce que la generation 
desdits nombres caracteristiques met en oeuvre pour un flux audio de 
reference et pour le flux audio transmis, les etapes suivantes : 

a) calculer pour chaque fenetre temporelle la densite 
25 spectrale de puissance du flux audio et lui appliquer un filtre representatif de 

Tattenuation de roreille interne et moyenne pour obtenir une densite spectrale 
filtree, 

b) calculer a partir de la densite spectrale filtree les excitations 
individuelles a Taide de la fonction d'etalement frequentiel dans I'echeile 

30 basilaire, 

c) determiner a partir desdites excitations individuelles la 
sonie compressee d Taide d'une fonction modelisant la sensibillte non Iin6aire 
en frequence de I'oreille, pour obtenir des composantes basilaires, 

d) s^parer les composantes basilalres en n classes (par 
35 exemple avec n ^ 5). de preference en trois classes, et calculer pour chaque 

classe un nombre C representant la somme des frequences de cette classe, 
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les nombres caracteristiques etant constitues par les nombres C. 
Alternativement, il y a n' < n nombres caracteristiques qui sont generes a 
partir desdits nombres C. n est choisi netttement inferieur au nombre 
d'echantillons audio d'une fenetre temporelle, parexemple inferieur a 0,01 fois 
5 ce nombre d'echantillons. 

Le procede peut etre caracterise en ce que la generation d'un 
dit nombre caracteristique met en csuvre, pour un flux audio de reference et 
pour un flux audio transmis, les etapes suivantes : 

a) caiculer N coefficients d'un filtre de prediction par une 
10 modellsation autoregressive, 

b) determiner dans chaque fenetre temporelle ie maximum du 
residu par difference entre le signal predit Taide du filtre de prediction et le 
signal audio, ledit maximum du r§sidu de prediction constituant un dit nombre 
caracteristique. 

15 Le procede peut §tre caract6ris6 en ce que la generation de 

dits nombres caracteristiques met en ceuvre pour un flux audio de reference 
et pour un flux audio transmis, les etapes suivantes : 

a) caiculer pour chaque fenetre temporelle la densite 
spectrale de puissance du flux audio et lui appliquer un filtre representatif de 

20 I'attenuation de Toreille interne et moyenne, pour obtenir une fonction 
d'etalementfrequentiel dans i'echelle basilaire, 

b) caiculer des excitations individuelles a partir de la fonction 
d'etalement frequentiel dans Techelle basilaire, 

c) obtenir a partir desdites excitations individuelles la sonie 
25 compressee a partir d'une fonction modelisant la sensibilite non lineaire en 

frequence de Toreille, pour obtenir des composantes basilaires , 

d) caiculer a partir desdites composantes basilaires N' 
coefficients de prediction d'un filtre de prediction par une modellsation auto- 
regressive, 

30 e) generer pour chaque fenetre temporelle au moins un 

nombre caracteristique a partir d'au moins un des N' coefficients de prediction. 

Les nombres caracteristiques peuvent etre constitues par 
entre 1 et 10 desdits coefficients de prediction, et preferentiellement entre 2 et 
5 desdits coefficients. 
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Pour un signal audio num^rique, un nombre caracteristique 
peut §tre la puissance instantanee et/ou la densite spectrale de puissance 
et/ou la bande passante. 

Pour un signal vid6o numerique, un nombre caracteristique 
5 peut §tre le coefficient continu de la transformee d'au moins une zone d'une 
irnage appartenant au flux de donnees par une transformee lineaire et 
orthogonale. par blocs ou globale, et/ou le contraste d'au moins une zone de 
{'image, et/ou ('activity spatiale SA d'au moins une zone d'une image ou son 
activity temporelle (celle-ci etant definie par comparaison avec une image 
10 precedente), et/ou la moyenne de la luminosite d'au moins une zone d'une 
image. 

Les points peuvent etre generes § partir d'au moins deux 
nombres caract6ristiques issus d'un seul param6tre caracteristique. 

Alternativement lesdits points peuvent etre g§n6r§s ^ partir 
15 d'au moins deux nombres caractdristiques issus d'au moins deux paramdtres 

caract^ristiques audio et/ou video. 

Le precede peut §tre caracteris6 en ce que le flux de donnees 
comporte des donnees vid§o et des donnees audio et en ce qu'll met en * 
ceuvre une premiere synchronistion video a partir de points D'i et D'a s 
20 assocl6es d au moins un parametre caracteristique video correspondant audit 1- 
flux video, et une deuxieme synchronisation audio a partir de points D"i et D"2 
associes d au moins un parametre caracteristique audio correspondant audit 
flux audio. 

II peut etre alors caracterise en ce qu'H presente une etape de 
25 determination du declage de synchronisation entre le flux video et le flux audio 
par difference entre lesdits decalages obtenus pour le flux video et pour le flux 
audio. 

D'autres caracteristiques et avantages de I'invention 
apparaitront mieux a la lecture de la description, en liaison avec les dessins 
30 annexes dans lesquels : 

- ia figure 1 illustre I'architecture d'un systeme de mesure de 
quai'ite d'un signal audio selon I'Art Anterieur ; 

- la figure 2 illustre ia probiematique de la synchronisation de 

signaux audio ; 
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- la figure 3 illustre une augmentation de la precision de la 
synchronisation susceptible d'etre obtenue dans le cadre de la presente 
invention ; 

- la figure 4 donne un exemple de deux trajectoires 
5 bidimensionnelles de signaux audio a synchroniser, dans le cas oCi r = A /2 ; 

- les figures 5 et 6 illustrent deux variantes de synchronisation 
entre deux trajectoires affectees aux deux flux de donnees ; 

- la figure 7 est un synoptique d'un procede de 
synchronisation selon Tinvention (synchronisation par trajectoire) ; 

10 - les figures 8 a 10 illustrent une synchronisation selon 

I'invention, le parametre significatif etant un parametre perceptuel audio, les 
figures 10a et 10b illustrant la situation avant et apres synchronisation de 
deux trajectoires. 

- la figure 1 1 illustre une mise en oeuvre du procede utiiisant 
IS connme parametre caracteristique une modeiisation autoregressive du signal, 

avec coefficients de prediction lln^aire. 

La premiere etape du procede correspond au calcul d'au 
moins deux nombres caracteristiques ^ partir d'un ou de plusieurs paramStres 
caractdristiques sur toutes les fenStres temporelles des signaux a 

20 synchroniser, sur la plage de synchronisation voulue : chaque nombre est 
done calcule toutes les dur^es A (Cf. Figures 2, et 3), ce qui donne N = T/A 
parametres. Ce ou ces nombres doivent §tre, si possible, simples a calculer 
pour ne pas demander trop de puissance de calcul. Chaque parametre 
caracteristique peut etre de nature quelconque et peut etre represents par 

25 exemple par un seul nombre. Par exemple, pour un signal audio un parametre 
caracteristique du contenu du signal peut etre la bande passante. 

Le fait de disposer des parametres seulement toutes les 
durees A permet de reduire grandement la quantite de donnees issues du 
signal de ref6rence Sr nScessaires a la synchronisation. Cependant, la 

30 precision de la synchronisation qui sera realisee est n6cessairement llmitee : 
rincertitude par rapport a une synchronisation ideale, c'est a dire a 
r§chantillon du signal pr6s, est de ±A/2. Dans le cas oil cette incertitude est 
trop grande, une alternative est de diminuer la periode A : cependant, cette 
modification est rarement possible car d'une part le calcul du ou des nombres 

35 caractenstiques est remis en cause, et d'autre part cela aboutit a augmenter 
la quantity de donnSes necessaire a la synchronisation. 
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Dans le mode particulier de realisation oD les parametres 
servent egalement a evaluer la qualite par comparaison des parametres Pi et 
P'l, toute erreur de synchronisation superieure a la valeur ro dite resolution du 
parametre ne permettra pas d'estimer les degradations introduites (Situation A 
5 de la Figure 3). 

Afin d*obtenir une precision de synchronisation arbitraire, 
d'une valeur d'incertitude r qui peut etre par exemple inf6rieure a A/2, tout en 
n'augmentant pas la quantite de donnees extraites du signal de reference, le 
precede peut mettre en <Buvre un calcul des nombres caracteristiques avec 

10 une resolution temporelle plus fine. Pour cela, les parametres sont calcules 
toutes les durees r < A, sur le second signal a synchroniser dit « degrade », ce 
qui correspond a A/r parametres pV pour un parametre Pi. La complexite de 
calcul augmente. en passant de T/A ^ T/r fenStres de calcul» mais seulement 
sur le signal regu. La situation B Figure 3 illustre la methode utilisee. Par 

15 exemple, r est un sous-multiple de A. 

Notations : 

T : plage de recherche de synchronisation. T est un 

multiple de A. 

ro : erreur / incertitude de synchronisation maximale 

20 admissible 

e : erreur de synchronisation 
A periode de calcul des parametres sur le signal. 
Pk : parametre calcule sur le premier signal dit de 
"reference" Sr. k est un indice temporel reperant a quelle periode de calcul A 
25 correspond Pk. 

P'k : parametre calcule sur le second signal dit "degrade" 
Sd. k est un indice temporel reperant a quelle periode de calcul A correspond 

rk 

- PV : parametre calcule sur le second signal dit "degrade" 
30 So- k est un indice temporel rep6rant d quelle periode de calcul A correspond 
Pk- i est un sous-indice temporel reperant un nombre de durees r a IMnterieur 
de la periode p compris entre 1 et A/r. 

Remarque : Toutes les durees correspondent a un nombre 
entier d'echantillons du signal audio ou vidSo. 
35 Pour definir une ou plusieurs coordonnees, la deuxieme etape 

applique un traitement sur les parametres. Un jeu de p coordonnees est 
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calcule pour chaque jeu de paramfetres Pk ou P'k' obtenu sur la fenStre k de 
duree A correspondant par exemple a 1024 echantillons, du signal reference 
ou d6grad6 respectlvement. 

o Le but premier de cette etape est d'obtenir des valeurs de 
5 coordonnees pertinentes pour realiser une synchronisation, et avec des 
bornes et limites donnees. Ainsi, chaque coordonnee est obtenue ^ partir 
d'une combinaison des nombres caracteristiques disponibles. De plus, cette 
etape permet de reduire le nonfibre de dimensions et done de simplifier les 
operations ulterieures. 
10 Dans un mode de realisation prefere, deux coordonnees 

doivent etre obtenues (p = 2). Par exemple, si deux paramdtres 
caracteristiques sont utilises, chacun d'eux peui servir pour determiner une 
coordonnee. Alternatlvement, un nombre plus eleve de nombres 
caracteristiques peut Stre utilise ; des traitements peuvent etre realises pour 
15 passer un nombre moins eieves de nombres, par exemple a deux 
coordonnees et ceux-ci s'interpretent alors comme une projection d'un espace 
d autant de dimensions que de nombres caracteristiques vers un espace d 
par exemple 2 coordonnees. 

La trolsieme etape conrespond ^ la construction de la 
20 trajectoire (Figure 4). La trajectoire definit une signature d'un segment du 
signal audio sur la duree T par une suite de points dans un espace S autant 
de dimensions que de coordonnees. L'utilisatlon d'un espace a deux 
dimensions ou plus permet de construtre une trajectoire bien particuliere, qui 
permet d'obtenir pour la synchronisation une flabilite et une precision elevees. 
25 Apres ces trois etapes, la synchronisation des signaux se 

resume a la synchronisation de deux trajectoires (ou courbes parametrees par 
le temps) dans un espace a deux dimensions ou plus : 

la premiere trajectoire est definie par les points R^, 
obtenus d partir des nombres significatifs Pr calcuies toutes les durees A sur 
30 la plage temporelle T. II y a N = T/A points Rr. 

- la seconde trajectoire est definie par les points Dk = Dk\ 
obtenus d partir des nombres significatife Pn = Pk^ calcuies toutes les durees A 
sur la plage T. II y a N' = N= T/A points Dk. 

Lorsque une duree r<A est utillsee pour calculer les 
35 parametres P'k', la trajectoire est definie par les points Dk', au nombre de 
N' = T/r points. 
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A cet effet, un critere de ressemblance entre deux trajectoires 



de N points (ou de N et N' points) est mis en oeuvre. Les methodes suivantes 
sont donnees a titre d'exemple : 

La premiere methode proposee est une minimisation d'une 
5 distance entre les deux trajectoires, 

L'idee de base est de calculer, sur une portion de la 
trajectoire, une distance. En fonction de la plage de desynchronisation 
maximale possible des courbes, correspondant aux signaux audio, ou video, 
une portion appropriee de chaque trajectoire est selectionnee. 
10 Sur ces portions, un cumul DifF des distances d entre les 

sommets Rk et Dk+deita ou D^+deita des courbes est calcule respectivement par 
les relations (1) et (2) ci-apres, en appliquant des decalages delta successifs 
afin de trouver le d6calage minimisant la distance Diff entre trajectoires. 



15 definis par deux coordonn§es, dans un espace S p = 2 dimensions, Sur le 
signal dit « degrade », les paramStres sont calcules toutes les durees 
c'est a dire avec une resolution deux fois plus fine que sur le premier signal 



moyenne arithmetique des distances sommet a sommet est un mode de 
20 realisation prefere, mais un autre calcul de distance est egaiement applicable. 



avec d(A,B) distance entre deux points ou sommets. Cette distance d(A,B) 
peut egaiement etre quelconque. Dans un mode particulier de realisation, la 
distance Euclidienne est utilisee : 



La Figure 4 illustre le calcul sur un exemple, avec des points 



La distance Diff donne Tecart entre les deux trajectoires. La 



D(^^e/r4 =^-f^34A»^-Kfe J oCi «D=l,.oo et N=:T/A 




(1) 



25 




(2) 



30 



Le d^calage delta donnant la distance Diff minimale 
correspond a la desynchronisation des courbes, et par consequent des 
signaux de depart. Dans I'exemple propose (Figure 4), le decaiage trouve 
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sera de 2, soit 2 fois la periode A de calcul du parametre initial. La plage de 
synchronisation sera done comprise entre : 

/H-2*A^- et /4.2*A+- (3) 
2 2 

Le deuxieme critere propose est une maxinnisation d'une 

5 correlation entre les deux trajectoires 

Ce crit6re fonctionne d"une maniere similaire au precedent, S 

la difference qu'il consiste a maximlser la valeur CorreL Les relations (1) et (2) 

sont remplacSes par les deux suivantes. 

CorreKdelta) = ^ A * ^k.^ita (4) 
10 oCi I'operation * est le produit scalaire defini par : 



^*5 = 



yV /V 



(5) 



oO Bj et bj sont les coordonn^es des points A et B. 

15 Les methodes ci-aprSs conviennent particuli^rement au cas 

ou p = 2 coordonnees 

D'autres techniques permettent de rendre le precede plus 
robuste a la presence de differences significatives entre les signaux a 
synchroniser, dues par exemple a des degradations lors d'une diffusion, a 

20 savoin 

o distance entre les angles successifs des trajectoires, 
Cette methode consiste ^ transformer la trajectoire 
bidimensionneite en un suite d'angles mesures entre des segments 
successifs definis par les points de la trajectoire. La Figure 5 illustre la 
25 definition des angles A9. 

Le critere utills6 pour synchroniser les deux trajectoires est 
la minimisation de la relation suivante : 
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Diff (delta) = j;^\<p. 



o surface interceptee entre les deux courbes. 

Cette m'ethode consiste S transformer la trajectoire 
bidimensionnelle en un suite des surfaces intercept^es par les segments 
successifs definis par les points de la trajectoire. La Figure 6 illustre la 
definition des surfaces interceptees S. 

Le critere utilise pour synchroniser les deux trajeotoires est 
la minimisation de ia relation suivante : 



1 0 Srotate = somme S Diff {delta) - J] A+^e/za 



(7) 



® Enfin, rutiiisation simultanSe de plusieurs criteres est 
possible. Une fois que la valeur delta du decalage de desynchronisation entre 
les deux signaux a ete d§tennin6e par une des methodes pr^cSdentes, les 
15 deux signaux peuvent etre resynchronises en appllquant le decalage delta ^ 
Tun des signaux. La synchronisation est realisee, avec une precision 
determin6e par la cadence de calcul des nombres caracteristlques. 

La synoptique d'un processus de synchronisation est donnee 

d la Figure 7. 

20 . ' Lorsque la precision voulue n'est pas atteinte, c'est a dire que 

la synchronisation est trop « grossiere » pour Tapplication visee, une dernifere 

etape peut consister a affiner (e resultat precedent. 

Une procedure de Tart anterieur peut etre appliquee sur la 

plage d'incertitude de synchronisation A ou r, qui est maintenant suffisamment 
25 reduite pour etre d'une compiexite acceptable. Une approche par correlation 

dans le domaine temporel, de preference avec signaux marqueurs, peut etre 

utilisee par exemple. 

Toutefois, cette etape ne devra etre mise a profit que dans 

certains cas particuliers. En effet. dans le type d'application visee de mesure 
30 de qualite, un affinage de la synchronisation n'est en general pas necessaire 

car fa precision obtenue est suffisante. De plus, les techniques de Tart 

anterieur necessitent. ainsi qu'il a et§ expliquS ci-dessus, de disposer de 
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donnees sur les signaux qui ne sont pas facilement transportables dans un 
systeme complexe et reparti. 

Un des modes particuliers de realisation correspond S la mise 
en ceuvre de Tinvention dans fe cadre d'une application de surveillance de la 
5 qualite audio dans un r6seau de diffusion de television numerique. Dans ce 
cadre, un interSt majeur de Tinventlon est d'utiliser les donnees servant ^ 
revaluation de qualite pour realiser la synchronisation, puisque cela evite ou 
minimise la n^cessite de transmettre des donnees sp§cifiques a la 
synchronisation, 

10 Divers nombres caracteristiques (reference reduite), destines 

a Testimation de Timportance des degradations introduites lors de la diffusion 
des signaux, sont caicules sur le signal de reference en entree du reseau, 
Ces nombres de reference Pr sont transmis via une vole de donnee jusqu'au 
point de mesure de la qualite. Des nombres caracteristiques Pm sont caicules 

15 sur le signal degrade au niveau de ce point de mesure. ^estimation de la 
qualite va ainsi se faire en comparant les parametres Pr et P^. Pour cela, lis 
doivent etre synchronises, a partir du ou des parametres caracteristiques 
utilises pour la reference. 

L'estimation de la qualite va ainsi se falre en comparant les 

20 parametres Pr et Pm- Pour cela. lis doivent Stre synchronises. 

Le principe des mesures perceptuelles objectives repose sur 
la transformation de la representation physique (pression acoustique, niveau, 
temps et frequence) en la representation psychoacoustique (force sonore, 
niveau de masquage, temps et bandes critiques ou barks) de deux signaux 

25 (le signal de reference et le signal ^ evaluer) afin de les comparer, Cette 
transformation s'opere grace a une modelisation de Tappareii auditif humain 
(generalement, cette modelisation consiste en une analyse spectrale dans le 
domaine des Barks suivie des phenomenes d'etalement). 

L'exemple ci-apres de mise en oeuvre du procede selon 

30 I'invention met en oeuvre un parametre caracterrstique perceptuel denomme 
« Ecart de Comptes Perceptuels ». Uidee originate pour ce parametre est 
d'etablir une mesure d'uniformite d'une fenetre du signal audio. Ainsi, un 
signal sonore dont les composantes frequentielles sont stables est considere 
comme uniforme, Inversement, un bruit « parfait » correspond ^ un signal qui 

35 couvre uniform6ment toutes les bandes de frequences (spectre plat). Ce type 
de parametre permet done de caracteriser le contenu du signal. Cette 
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capacite est renforcee par son caractere perceptuel. c'est a dire la prise en 
compte de caracteristiques du systeme auditif humain connues par la 
psychoacoustique. 

Plusieurs etapes sont mises en oeuvre pour tenir compte de 
5 la psychoacoustique. Elles sont appliquees sur le signal de reference et sur le 
signal degrade. Ces etapes sont les suivantes : 

© Fendtrage du signal temporel en blocs, puis, pour chaque 
bloc, calcul de Texcitatlon induite par le signal en utilisant un module 
d'audition. Cette representation des signaux tient compte des phenomenes de 

10 la psychoacoustique, et fournit un histogramme dont les comptes sont les 
valeurs des composantes basilaires. Cela permet de ne prendre en 
consideration que les composantes audibles du signal et done de se limiter a 
rinformation utile. Pour obtenir cette excitation, les modelisations classiques 
peuvent etre utilisees : attenuation de Toreille externe et moyenne, integration 

15 selon les bandes critiques et masquages frequentiels. Les fenetres 
temporelles choisies sont d'environ 42 ms (2048 points a 48 kHz) avec un 
recouvrement de 50%, Cela permet d'obtenir une resolution temporelle de 
I'ordre de 21 ms. 

Plusieurs stapes inten/iennent pour cette modelisation. Pour 

20 la premiere etape, le filtre d'attSnuation de i'oreille externe et moyenne est 
appliqud d la densite spectrale de puissance, obtenue a partir du spectre du 
signal. Ce filtre prend egalement en compte le seuii absolu d'audition. La 
notion de bandes critiques est modelisee par une transformation de Techelle 
fr^quentielle en une dchelle basilaire. L'etape suivante correspond au calcul 

25 des excitations indivlduelles pour tenIr compte des phenomenes de 
masquage, grace a la fonction d*etalement dans Techelle basilaire et a une 
addition non iineaire. La derniere etape permet d'obtenir la sonie compressee, 
par une fonction puissance, pour modeliser la sensibilite non Iineaire en 
frequence de Toreille, par un histogramme comportant les 109 composants 

30 basilaires. 

® Les comptes de Thistogramme obtenus sont ensuite 
periodiquement vectorises en trois classes pour obtenir une representation 
selon une trajectoire. C'est cette trajectoire qui permet de visualiser revolution 
de la structure des signaux et sert d la synchronisation. Cela pennet 
35 egalement d'obtenir une caracterisation simple et concise du signal et done de 
disposer d'un parametre de reference (ou parametre caracteristique). 



18 

Plusieurs strategies existent pour fixer les bomes de ces trois 
classes : La plus simple est de separer rhistogramme en trois zones de tailles 
egales. Ainsi, les 109 composantes basilaires, qui repr6sentent 24 Barks, 
peuvent etre separ6es aux indices suivants : 

5 ISi - 36 soit - = ^ * 36 = 7,927 Barks (8) 

IS2 = 73 soit = * 73 = 1 6,073 Barks (9) 

La deuxifeme strategie prend en compte les zones de mise a 
Techelle (« Scaling ») de BEERENDS. Cela correspond a une compensation 
du gain entre Texcitation du signal de reference et celle du signal a tester en 
10 considerant trois zones sur lesquelles [•oreille realiserait cette meme 
operation. Ainsi. les bornes fixees sont les suivantes : 

24 

IS1 = 9 soit 2 = — * 9 = 1,982 Barks (10) 
24 

1S2= 100 soit ^ = ^-100 = 22,018 Barks (11) 

La trajectoire est ensuite representee dans un triangle, 
15 nomme triangle des frequences. Pour cheque bloc on obtient trois comptes 
Ci. C2 et C3, done deux coordonnees cartesiennes selon les formules 
suivantes : 

- X^CJN^^ (12) 

r=C2/iV*sin(;r/3) (13) 

20 avec Ci : somme des excitations pour les hautes frequences 

(au-dessus de S2) 
C2 : compte associe aux frequences moyennes (composantes 
entre Si et S2) 
et A/ = Ci+ C2+ C3 : Somme totale des valeurs des 
25 composantes, 

Un point (X, Y) est done obtenu pour chaque fenetre 
temporelle du signal. Chacune des coordonnees X et Y constitue un nombre 
caracteristique. Alternativement, Ci, C2 et C3 peuvent etre pris comme 
nombres caracteristiques. 
30 Pour une sequence complete, ia representation assoclee est 

ainsi une trajectoire parametrde par le temps, comme le montre la figure 8. 
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Parmi diff^rentes methodes possibles pour effectuer la 
synchronisation des trajectoires, la technique cholsie a titre d'exemple est 
celle basee sur nninimisation de la distance entre les points des trajectoires. 

II est important de noter que le calcul du parametre utilise 
5 dans ce cas pour la synchronisation reste complexe, mais ce parametre peut 
§tre 6galement utilise pour estimer la qualite du signal. 11 doit done de toute 
fagon etre calcuie, et ce n'est done pas una charge suppl6mentalre ajout^e au 
calcul lors de la comparalson, d'autant que le calcul relatif a' ce parametre 
n'est effectue localement que pour le flux numerique repu. 
10 La figure 9 resume le procede utilise pour synchroniser les 

signaux dans le cadre de la supervision de la qualite de signaux diffuses, avec 
le parametre caract§rlstique ci-dessus. 

L'exemple sulvant illustre le cas d'un fichier reference (R1), 
code puis decode MPEG2 Layer2 S 128 kbits/s pour obtenir un fichier 
15 d6grad6 (R2). La d6synchronlsatlon Introduite est de 6000 6chantllIons. Le 
ddcalage trouv§ est de 6 fenStres soit 6 * 1024 = 6144 6chantlllons. L'erreur 
(144) est bien lnf§rieure a la periode (1024) du paramdtre caract6ristlque 
utilise. Les figures 10a et 10b pF§sentent les trajectoires avant puis apr§s 
synchronisation : 

20 Avant synchronisation (figure 10a). 11 n'y a pas de 

correspondance point a point entre les deux trajectoires. Apr^s 
synchronisation (figure 10b), la correspondance entre les deux trajectoires est 
optimale au sens du critere de distance (Cf. relation (1). 

11 n'est, en general, pas necessaire de faire une 

25 synchronisation plus fine. Cast notamment le cas si I'incertitude donnee par la 
procedure exposee ici est inferieure a l'erreur de synchronisation maximale 
admissible par le parametre de mesure de qualite. Pour les parametres de 
qualitom^trie les plus exigeants, la resolution necessaire To est de I'ordre de 
32 echantillons. 

30 Dans le cas de la figure 10a, la plage initiate est de I'ordre de 

120 ms, soit 5760 Echantillons ^ 48 kHz. En utilisant uniquement les nombres 
caracterlstiques disponibles pour revaluation de la qualite (tous les 1024 
echantillons. soit la dur§e A), une premiere synchronisation est realls6e avec 
une incertitude de 1024 Echantillons, soit un facteur supErieur a 5 par rapport 

J5 a 5760, pour une puissance de calcul consacree d la synchronisation tr6s 
limitee. 
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Cependant, par example dans une seconde etape, le calcul 
plus frequent des paramdtres de qualite sur le second signal (degrade) (r < A) 
permet si on le desire de reduire encore Terreur de synchronisation a r 
echantillons. 

5 Un autre parannetre caracteristique nnet en oeuvre une 

modellsation autoregressive du signal. 

Le principe gendral de la prediction lineaire est de modeliser 
le signal comme etant une combinaison de ses valeurs passees. Uidee est de 
calculer les N coefficients d'un filtre de prediction par une modelisation 
10 autoregressive (tout pole). Avec ce filtre adaptatif, ii est possible d'obtenir un 
signal predit a partir du signal reel. Les erreurs de prediction ou residus sont 
calcules par difference entre ces deux signaux. La presence et la quantite de 
bruit dans un signal peuvent etre determinees par ['analyse de ces residus. 

La comparaison des residus obtenus sur le signal de 
15 reference et ceux calcules a partir du signal degrade, et done des niveaux de 
bruit, permet d'estimer rimportance des modifications et defauts Inseres. 

La reference a transmettre correspond au maximum des 
residus sur une fenetre temporelle de taille donn6e. II n'est en effet pas 
interessant de transmettre tous les residus si le debit de la r^fSrence veut dtre 
20 reduit. 

Pour adapter les coefficients du filtre de prediction, deux 

m6thodes sont donn6es ci-apres d titre d'exemple : 

- L'algorithme de LEVINSON-DURBIN qui est decrit par 

exemple dans Touvrage de M. BELLANGER - Traitement numerique du signal 
25 - Theorie et pratique (MASSON ed. 1987) p. 393 a 395. Pour I'utiliser, 11 faut 

disposer d'une estimation de Tautocorrelation du signal sur un ensemble de No 

echantillons, Cette autocorrelation est utilisee pour resoudre le systeme 

d'equations de Yule-Walker et ainsi obtenir les coefficients du filtre predicteur. 

Seules les N premieres valeurs de la fonction d'autocorrelation peuvent etre 
30 utilisees, oD N designe Tordre de l'algorithme. c'est-a-dire le nombre de 

coefficients du filtre. Sur une fenetre de 1024 Echantillons, on garde le 

maximum de Terreur de prediction. 

L'algorithme du gradient qui est ddcrit par exemple dans 

rouvrage precite de M. BELLANGER p. 371 et suivantes. Le principal 
35 inconvenient du parametre precedent est la necessite, dans le cas d'une 

implantation sur DSP, de stocker les No echantillons pour estimer 
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rautocorrelation, avoir les coefficients du filtre puis calculer les r6sidus. Ce 
second parametre permet d'eviter cela en utilfsant un autre algorithme 
permettant de calcufer les coefficients du filtre : ralgoritlime du gradient. Celui- 
ci utilise Terreur commise pour mettre a jour les coefficients. Les coefficients 
5 du filtre sont modifies dans la direction du gradient de I'erreur quadratique 
instantanee, avec le signal oppose. 

Une fois les residus obtenus par difference entre le signal 
predit et le signal reel, seul le maximum de leurs valeurs absolues, sur une 
fenetre temporelle de taille donnee T, est conserve. Le vecteur reference a 
10 transmettre peut ainsi etre reduite ^ un seul nombre. 

Apres transmission puis synchronisation, la comparaison 
consiste en un simple calcul de distance entre les maxima de la reference et 
du signal degrade par exemple par difference. 

Le principal avantage des deux parametres est le d^bit 
15 nScessaire au transfert de la reference. Celui-ci permet de rSduire la 
reference a une valeur pour 1 024 echantillons de signal. 

Par contre, aucun modele de la psychoacoustique n'est pris , 

en compte. 

Un autre paramdtre caracteristique met en oeuvre une 

20 modelisation autor^gresslve de I'excitatlon basllaire. 

Par rapport a la prediction lin§aire classique, cette methode 
permet de prendre en compte les phenomenes de la psychoacoustique, afin 
d'obtenir une evaluation de la qualite perdue. Pour cela, le calcul du 
parametre passe par une modelisation de divers princlpes de Taudition. Une 

25 prediction lineaire modelise le signal comme etant une combinaison de ses 
valeurs passees. L'analyse des residus (ou erreurs de prediction) permet de 
determiner et d'estimer la presence de bruit dans un signal, Linconvenient 
majeur iors de rutiiisation de ces techniques est le fait qu'il nV ait aucune prise 
en compte des principes de la psychoacoustique. Ainsi, il n'est pas possible 

30 d'estimer la quantite de bruit reellement pergue. 

Le proced6 reprend le principe general de la prediction 
lineaire classique. Eile y integre en plus les phenomenes de la 
psychoacoustique pour {'adapter § la senslbllite non lineaire en frequence 
(sonie) et en intensity (tonie) de Toreille humaine. 

35 On modifie le spectre du signal, par Tintermediaire d'un 

modele d'audition, avant de calculer les coefficients de la prediction lineaire 
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par une modelisatlon autor^gressive (tout p6le). Les coefficients ainsi obtenus 
permettent de modellser le signal de fagon simple tout en tenant compte de la 
psyclioacoustique. Ce sont ces coefficients de prediction qui seront transmis 
et serviront de reference lore de la comparaison avec le signal degrade. 
5 La premiere partie du calcul de ce param^tre correspond a la 

modelisation des principes de la psychoacoustique en utilisant les modeles 
d'audition classiques. La deuxieme partie est le calcul des coefficients de 
prediction (ineaire. La derniere partie correspond a la comparaison des 
coefficients de prediction calcufes pour le signal de reference et ceux obtenus 
10 pour le signal degrade. Les differentes etapes de cette methode sont done les 
suivantes : 

- Fenetrage tempore! du signal puis calcul d'une 
representation interne du signal par modelisation des phenomenes de la 
psychoacoustique. Cette etape correspond au catcul de la sonie compressee, 

15 qui est en fait I'excitation induite par le signal au niveau de roreille Interne. 
Cette representation des signaux tient compte des phenomenes de la 
psychoacoustique, et est obtenue k partir du spectre du signal, en utilisant les 
mod61isatlons classiques : attenuation de Toreille externe et moyenne, 
integration selon les bandes critiques et masquages frequentiels. Cette §tape 

20 du calcul est identique au parametre d^crit prec6demment 

- Modelisation autor6gressive de cette sonie compressee afin 
d'obtenir les coefficients d'un filtre RIF de prediction, tout comme dans une 
prediction lineaire classique. La methode utilisee est celle de Tautocorrelation, 
par resolution des equations de Yule-Walker. La premiere etape pour 

25 Tobtention des coefficients de prediction est done le calcul de Tautocorrelation 
du signal. 

En considerant la sonie compressee comme une puissance 

spectraie fiitree, il est possible de calcuier Tautocorrelation du signal pergu par 

transformation de Fourier inverse, 
30 Une des methodes pour resoudre ce systeme d'equations de 

Yule-Walker et ainsi obtenir les coefficients d'un filtre pr§dicteur est Tutilisation 

de Talgorithme de Levinson-Durbin. 

Ce sont les coefficients de prediction qui constituent le vecteur 

de reference 6 transmettre jusqu'au point de comparaison. Les 
35 transformations utilisees lors du calcul final sur le signal degrade, sont les 

memes que pour la phase initiate sur le signal de reference. 
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- Estimation des degradations par le calcul d'une distance 
entre les vecteurs issue de la reference at du signal degrade. C'est une 
comparaison des vecteurs de coefficients definissant des points obtenus pour 
la reference et pour le signal audio transmis. qui permet d'estimer les 

5 degradations introduites lors de la transmission. Celle-ci doit se faire sur un 
nombre adapte de coefficients. Plus le nombre est important, plus les calcuis 
peuvent etre precis, mais plus le debit necessaire a la transmission de la 
reference est eleve. Plusieurs distances peuvent etre utilisees pour comparer 
les vecteurs de coefficients, Limportance relative des coefficients peut par 
10 exemple etre prise en compte. 

Le principe de la methode se resume selon le schema suivant 

(Figure 11). 

La modelisation des phenomenes de la psychoacoustique 
permet d'obtenir 24 coniposantes basilaires. L'ordre N du filtre de prediction 

IS est de 32. A partir de celles-ci, 32 coefHcients de rautocorrelation sont 
estlmes, ce qui donne 32 coefficients de prediction dont on ne conserve que 5 
^10 coefficients en tant que vecteur indicateur de qualite, par exemple les 5 a 
1 0 premiers coefficients . 

Le principal avantage du parametre provient de la prise en 

20 compte des phenomenes de la psychoacoustique. Pour faire cela, il a ete 
necessaire d'augmenter le d§bit necessaire au transfert de la reference d 5 ou 
10 valeurs pour 1024 echantillons de signal (21 ms.), soit un debit de 7,5 a 15 
kbits/s. 

Le parametre caracteristique P peut etre d'une maniere 
25 generate toute grandeur obtenue a partir du contenu des signaux numeriques 
et par exemple en video : 

- la luminosite de Timage ou d'une zone de celle-ci tel que 
donnee par ie coefficient continu F(0,0) de la transformee en cOsinus discrete 
TCD de Timage, ou de tout autre transformee par blocs, lineaire et 

30 orthogonale, par blocs ou globale, 

- et/ou le contraste de Fimage ou d'une zone de celle-ci. 
donne par exemple par rapplication d'un filtre de Sobel, 

- et/ou I'activite de I'Image SA de Timage telte que definie par 
exemple dans la Demande PCT WO 99/18736 de la Demanderesse, et 

35 obtenue par une transformation par blocs lineaire et orthogonale (TCD, 
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transformee de FOURIER, de HAAR, d'HADAMARD, de SLANT, transform6e 
en ondelettes etc.). 

- la moyenne de rimage, 
et en audio : 

5 - la puissance, 

- et/ou bien la densite spectrale de puissance telle que definie 
dans la demande de Brevet Frangais FR 2 769 777 deposee le 13 Octobre 
1997, et/ou un des param^tres decrits ci-dessus. 

On remarquera que le parametre P est susceptible d'etre 

10 soumis a des degradations dues a la transmission, mais on observe en 
pratique, qu*aux niveaux de degradation generalement observes dans les 
reseaux de transmission, la synchronisation peut etre effectuee a Taide du 
precede selon Tinvention. 

D'une maniere g6n§rale, une fois la synchronisation acquise, 

15 le procede perniet de verifier qu'elle est bien conservee. de maniere a pouvoir 
remedier en tant que de besoin aux perturbations telles qulnterruption de flux 
binaire, changement de flux binaire, changement de decodeur, etc., en 
resynchronisant les deux signaux numeriques E et S. 

Le procede decrit est applicable d chaque fois qu'il est 

20 n^cessaire de synchroniser deux flux numeriques. La m§thode permet 
d'obtenir une premiere plage de synchronisation de largeur suffisamment 
reduite pour autoriser Tutilisation de methodes de synchronisation fine 
classiques, et cela en temps reel. 

Le procede exploite avantageusement un ou plusieurs 

25 parametres caracteristiques des signaux a synchroniser qui sont representes 
par au moins deux nombres caracteristiques, au lieu de la totalite des 
signaux. Selon une realisation preferee, Tutilisation combinee de plusieurs 
parametres permet d*assurer une fiabiiite de synchronisation superieure aux 
techniques anterieures. De plus, Unvention permet de realiser une 

30 synchronisation d'un niveau de precision qui peut §tre choisi, et d'une 
complexite plus faible que les methodes existantes. Cette synchronisation 
delimite une plage d'erreur, d*une duree autorisant par la suite Tutilisation de 
methodes classiques de synchronisation « fine » si une precision plus elevee 
est requise. 

35 L'equipement de mesure Implantant le proc§d§ de Tinvention, 

trouve son application notamment dans le domaine des reseaux de diffusion 
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des signaux audlovisuels num^riques afin de permettre une surveillance de la 
quality des signaux ddlivres par le r^seau. 

L'inventlon permet 6ga!ement de r^aliser, pour un flux de 
donnees Incorporant des donnees audio et video, une synciironisatlon pour le 
5 son et pour I'image. A cet effet, une synchronisation est effectu6e pour la 
video, en calculant un decalage de synchronisation pour la video, et une 
synchronisation est effectu^e pour I'audio, en calculant un decalage de 
synchronisation pour I'audio. De plus, en comparant la valeur des deux 
decalages, on peut savoir si lors par exemple d'une transmission, il s'est 
10 produit un decalage entre le son et I'image. 
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REVEMDICATIOWS 
1 Precede de synchronisation entre deux flux de donnees 
numeriques de m§me contenu caracterise en ce qu'il met en oBuvre : 

a) pour chacun des deux flux de donnees numeriques Si et 
5 S2, une generation a des intervalles donnes d'au moins deux nombres 

caracteristiques exprimant au moins un parametre caracteristique de leur 
contenu ; 

b) pour chacun des deux flux Si et S2, la generation, a partir 
desdits nombres, de points Di et D2 representant au moins un dit parametre 

10 caracteristique dans un espace a au moins deux dimensions, les points Di 
correspondant au flux Si d'une part et D2 correspondant au flux S2 d'autre part 
qui sont situes dans une plage temporelle T definissant des trajectoires 
representatives des flux de donnees S-\ et S2 a synchroniser ; 

c) decaler Tune par rapport a Tautre les plages temporelles de 
15 duree T affectees aux flux de donnees numeriques Si et S2 en calculant un 

critere de superposition desdites trajectoires dont une valeur optimale 
reprSsente la synchronisation recherchee ; 

d) choisir comme valeur representative de la synchronisation, 
ie decalage entre les plages temporelles correspondant a ladite valeur 

20 optimale. 

2. Precede selon la revendication 1, caract6ris6 en ce qu'un 
des flux de donnees numeriques est un flux de reference Si et en ce que 
Tautre flux de donnees est un flux S2 re9u A travers un systeme de 
transmission et en ce que les nombres caracteristiques du flux de reference 

25 Si sont transmis avec celui-ci, alors que les nombres caracteristiques du flux 
regu S2 sont calcules a la reception. 

3. Precede selon une des revendications 1 ou 2, caracterise 
en ce que c) met en oeuvre : 

c1) calculer une distance D entre d'une part une premiere 
30 trajectoire representee par les points Di appartenant a une premiere plage 
temporelle de duree T, et d'autre part, une deuxieme trajectoire representee 
par les points D2 appartenant ^ une deuxieme plage temporelle de duree T, 
ladite distance D constituant ledit critere de superposition ; 

c2) decaler Tun par rapport a I'autre lesdites premiere et 
5 deuxieme plages temporelles de duree T jusqu'a obtention d'un minimum de 
la distance D qui constitue ladite valeur optimale ; 
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4. Proc6de selon la revendication 3, caracterise en ce que la 
distance D est une moyenne arithmetique des distances d entre les points 
correspondants Di. D2 des deux trajectolres. 

5. Precede selon la revendication 4, caracterise en ce que 
5 ladite distance d entre les points est une distance euclidienne. 

6. Precede selon une des revendications 1 ou 2, caracterise 
en ce que c) met en oeuvre : 

. . c1) calculer une fonction de correlation entre les points 

correspondants Di, D2 des deux trajectoires, ladite fonction de correlation 
10 constituant led it critere de superposition ; 

c2) decaler i'un par rapport a I'autre lesdites premiere et 
deuxieme plages temporelles de duree T jusqu'a obtention d'un minimum de 
la fonction de correlation qui constitue ladite valeur optimale. 

1. Proc6d6 selon une des revendications 1 ou 2, caracterise 
15 en ce que c) met en oeuvre : 

c1) transformer chaque trajectoire en une suite d'angles entre 
des segments successifs definis par les points de la trajectoire. 

c2) decaler Tun par rapport a I'autre lesdites premiere et 
deuxieme plages temporelles de duree T jusqu'd obtenir un minimum entre les 
20 diffdrences entre les valeurs d'angles obtenues pour des segments 
homologues des deux trajectoires, ledit minimum constituant ladite valeur 
optimale. 

8. Precede selon une des revendications 1 ou 2, caracterisd 
en ce que c) met en oeuvre : 

25 c1) transformer les deux trajectoires en une suite de surfaces 

interceptees par les segments successifs definis par les points desdites 
trajectoires, la surface totale interceptee constituant ledit critere de 
superposition. 

c2) decaler Tun par rapport a I'autre les plages temporelles de 
30 duree T jusqu'a obtenir un minimum de ladite surface totale interceptee, qui 
constitue ladite valeur optimale. 

9. Precede selon une des revendications precedentes, 
caracterise en ce qu'un dit intervalle donne est egal a A pour un des flux de 
donn6es Si et a r < A pour Tautre flux de donnees S2. 

35 10. Procede selon une des revendications prec6dentes, 

caracterise en ce qu'il met en oeuvre une premiere synchronisation en 
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choisissant un meme intervalle donne A pour les deux flux de donnees, puis 
une deuxieme synchronisation pour laquelle Tintervalle donne est egal a A 
pour un des flux de donnees S1 et a r < A pour Tautre flux de donnees S2. 

11. Precede selon une des revendications precedentes, 
5 caract6rise en ce que la generation desdits nombres caracteristiques met en 

oeuvre pour un flux de donnees audio de reference et pour un flux de donnees 
' audio transmis, les etapes suivantes : 

a) calculer pour chaque fen§tre temporelle la densite 
spectrale de puissance du flux audio et lui appliquer un filtre representatif de 

10 Tattenuation de Toreille Interne et moyenne pour obtenir une densite spectrale 
filtree, 

b) calculer 6 partir de la densite spectrale filtree les excitations 
individuelles a Taide de la fonction d'6talement frSquentiel dans rechelle 
basilaire, 

IS c) determiner a partir desdites excitations individuelles la 

sonie compressee ^ Taide d'une fonction modelisant la sensibility non llneaire 
en frequence de Toreille, pour obtenir des composantes basilaires, 

d) separer les composantes basilaires en n classes (avec n 
nettement inferieur au nombre d'echantillons audio d'une fenetre temporelle) , 

20 de preference en trois classes, et calculer pour chaque classe un nombre C 
representant la somme des frequences de cette classe, ces nombres 
caracteristiques etant au nombre de n et constitues par un dit nombre C ou 
etant au nombre de n' < n et etant generes a partir desdits nombres C. 

12. Precede selon une des revendications precedentes, 
25 caracterise en ce que la generation d'un dit nombre caracteristique met en 

oeuvre, pour un flux de donnees audio de reference et pour un flux de 
donnees audio transmis, les etapes suivantes : 

a) calculer H coefficients d'un flitre de prediction par une 
modelisation autoregressive, 
30 b) determiner dans chaque fenetre temporelle le maximum du 

residu par difference entre le signal predit a Taide du filtre de prediction et le 
signal audio, ledit maximum du residu de prediction constituant undit nombre 
caracteristique. 

13. Proc6d§ selon une des revendications pr6cedentes. 
35 caract§rise en ce que la generation de dlts nombres caracteristiques met en 
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csuvre pour un flux de donn^es audio de reference et pour un flux de donn6es 
audio transmis, les etapes suivantes : 

a) calculer pour chaque fenetre temporelle ia density 
spectraie de puissance du flux audio et lui appliquer un fiitre representatlf de 

5 rattenuation de I'oreille interne et moyenne. pour obtenir une fonction 
d'etalement frequentiel dans I'^chelle basilaire, 

b) calculer des excitations indlviduelles a partir de !a fonction 
d'etalement frequentiel dans l'4chelle basilaire, 

c) obtenir a partir desdites excitations indlviduelles la sonie 
10 compressee a partir d'une fonction modelisant la sensibilite non linealre en 

frequence de I'oreille, pour obtenir des composantes basilaires , 

d} calculer d partir desdits composantes basilaires N' 
coefficients de prediction d'un fiitre de prediction par une modellsation auto- 
regressive, 

15 e) generer pour chaque fendtre temporelle au moins un 

nombre caracteristique ^ partir d'au moins des N' coefficients de prediction. 

14. Proced6 selon la revendication 13, caract6ris6 en ce que 
les nombres caract^rlstlques sent constitues par, entre 1 et 10 desdits 
coefficients de prediction, et preferentiellement entre 2 et 5 desdits 

20 coefficients. 

15. Precede selon une des revendications precedentes, 
caracterise en ce qu'un nombre caracteristique est la puissance instantan6e 
d'un signal audio. 

16. Proc6d§ selon une des revendications precedentes, 
caracterise en ce qu'un nombre caracteristique est le densite spectraie de 
puissance d'un signal audio. 

17. Precede selon une des revendications precedentes, 
caracterise en ce qu'un nombre caracteristique est la bande passante d'un 
signal audio. 

18. Precede selon une des revendications precedentes, 
caracterise en ce qu'un nombre caracteristique est le coefficient continu de la 
transfonnee par une transformee lineaire et orthogonale d'au moins une partie 
d'une image appartenant au flux de donnees, cette transfonnee etant reallsee 
par blocs ou globaiement. 
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19. Procede selon une des revendications pr^cedentes, 
caracterise en ce qu'un nombre caracteristlque est le contraste d'au moins 
une zone d'une image appartenant au flux de donnees. 

20. Procede selon une des revendications precedentes, 
5 caracterise en ce qu'un nombre caracterlstique est Tactivite spatiale ou 

temporelle d'au moins une zone d'une image. 

21. Procede selon une des revendications precedentes. 
caracterise en ce qu'un nombre caracteristlque est la luminosite moyenne 
d'au moins une zone d'une image, 

10 22, Procede selon une des revendications precedentes, 

caracterise en ce que lesdits points Di et D2 sont generes partir d'au moins 
deux parametres caracteristiques, 

23 Procede selon la revendication 22, caracterise en ce que 
lesdits parametres caracteristiques sont des parametres audio. 
15 24. Procede selon la revendication 22, caracterise en ce que 

lesdits parametres caracteristiques sont des parametres vld6o, 

25 Procede selon une des revendications precedentes, 
caracterise en ce que le flux de donn6es comporte des donnees video et des 
donn6es audio et en ce quil met en oeuvre une premiere synchronistion video 
20 d partir de points D'l et D 2 associ6es a au moins un parametre caracteristique 
vid§o correspondant audit flux video, et une deuxieme synchronisation audio 
a partir de points D''i et D'a associes d au moins un parametre caracteristique 
audio correspondant audit flux audio. 

26. Procede selon la revendication 25, caracterise en ce qu'il 
25 presente une etape de determination du declage de synchronisation entre le 
flux video et le flux audio par difference entre lesdits decalages obtenus pour 
le flux video et pour le flux audio. 
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